音声情報処理 11
歌詞の処理
⾳楽における⾳声⾔語
⾳楽という制約による⾔語の変化
⾳の数を合わせる
押韻
音が一緒
曖昧な表現による没⼊感
文章だと使えない
限定すると想像の余地が減る
外来語の併⽤
⾳声認識に対する影響
⼀般的な⽂法ルールが適⽤できない可能性
言語が変化してるので..
語彙が異なる
各単語の発⽣頻度が変わる:「会いたい」問題
単語の連鎖が変わる:「桜 舞いすぎ」「瞳 閉じすぎ」
⾳声と歌詞の違い
⽬的の違い
⾳声:意思疎通(相⼿に意図を理解してもらう)
歌詞:感情や情景を伝える(相⼿に共感してもらう)
表現の違い
⾳声:感情やコンテキストによってPitch ピッチや⾳量が変化する
歌詞:ピッチは⾳楽によって制約される
単語の違い
⾳声:意思や対象を正確に伝えるための⾔葉が選ばれる
歌詞:押韻やリズムなどによって制約を受ける
恋愛ソングの分類
歌詞で突出するトピック「恋愛」
流⾏する恋愛の変遷
時代に応じて変化する⽂の形態
平安時代からある
同⼀のトピックであっても細分化される
扱われる単語が異なる
教科書に図あり
要約から分かるトピックの同⼀性
Word cloudを⽤いて秋元康の歌詞を可視化
同じようなことしか⾔っていない
⾳楽の⾳響的な特性との組み合わせによって⾳楽が特徴化されている?
語彙の豊かさの指標と⽐較
理解語彙と使⽤語彙に分類して分析
理解語彙
ある個⼈が理解できる語の集合
知っている単語
使⽤語彙
語彙⼒の豊かさ
ある個⼈が使⽤できる語の集合
使える単語
客観的指標による語彙⼒の⽐較
語彙の豊かさを⽰す指標
K特性値
テキストの長さに依存
TTR
Type-token ratio
異なり語数/述べ語数
⼈称代名詞による⽂体の分析
⽇本語の⼈称代名詞は多種多様
代名詞の多様性
⾳声⾔語としては意味は同じ⼀⼈称
歌詞としては違う印象
歌詞分析のために必要となる⾔語への対応
擬⾳詞と擬態詞
⼀般的には副詞:歌詞では修飾対象がない
ぎゅっ!ぎゅっ!ぎゅっ!!!抱きしめて!
Chu♪ Chu♪True love☆ I love you ☆
漢字仮名変換の難しさ
どの⽂字種にするのか
漢字、カタカナ、ローマ字、ひらがな
チュとChuの分類
♪と☆の違いも⾳響からはわからない
破綻した⽂法に対するアプローチ
⽇本語の⼀般的に発⽣頻度が⾼い⽂法とは異なる⾔葉
主語や⽬的語の⽋落
⽐喩表現(直喩,暗喩)
単語の誤った使い⽅
不必要な単語の繰り返し
主旨が不明な⽂
意図伝達ではなく情景描写
⼈間であれば,歌詞に対して⼀定の共通した印象をもつ
歌詞に対する理解
社会や時代によって聴取者の理解は変化する
理解していなくても楽しめる
単語がもつ役割の変化
アイコン、ブロックなど
⼈間と同じ様に歌詞を理解する
どのような⼈間として歌詞を読むのか?
歌詞は世の中の流れを写す鏡
どのような⾔語がどの時代に使われていたのか
システムが⾳楽を聴いて感動するためには
⾳響に対する感性モデルの構築
どのような⾳に対して,どのように感じるのか
⾳楽の規則性や規則からの逸脱
歌詞に対する感性モデルの構築
どのような単語に,どのように感じるのか
どのような表現(言語表現?)に,どのように感じるのか
⾳響と歌詞のモデルの協調
⼈間の⾳楽に対する感性 Sensibilityは,⾳響×歌詞なのか?⾳響+歌詞なのか?